如何控制观察性疗效比较研究中的混杂因素:(三)混杂因素控制的敏感性分析方法
摘自:中华流行病学杂志,2019,40(12):1645-1649.
DOI:10.3760/cma.j.issn.0254-6450.2019.12.026
黄丽红,赵杨,魏永越,陈峰
摘 要
【关键词】观察性疗效比较研究;混杂;控制;敏感性分析方法
引 言
混杂因素控制的统计分析方法一直备受学者关注,尤其是未测量混杂因素,新方法也在不断涌现,但有些方法还未经过实践考察,作为敏感性分析方法提出。敏感性分析可在主要分析的基础上提供补充信息,助力于干预与结局的关联性判定。本文从统计学角度就设计良好的观察性疗效比较研究(CER)中的敏感性分析方法进行述评,并结合案例加以说明。
1.已测量混杂因素的
敏感性分析方法
传统的敏感性分析包括单因素敏感性分析和多因素敏感性分析。单因素敏感性分析即在固定其他因素的条件下,变动其中一个不确定因素;然后,再变动另一个因素(仍然保持其他因素不变),以此求出某个不确定因素本身对结局的影响程度。多因素敏感性分析法是指在假定其他不确定性因素不变条件下,计算分析两种或两种以上不确定性因素同时发生变动对结局的影响程度,确定敏感性因素及其极限值。
针对已测量混杂因素,可采用传统的敏感性分析方法,通过改变已有的信息来考察研究结果的稳健性,例如纳入不同的协变量组合,比较不同调整情形下研究结果的变化;纳入不同的对照组,比较观察到的潜在偏倚的差别;改变结局的定义(如临床相关结局通过几种不同的方式加以确定),根据这些不同的结局进行再分析,可以揭示最初的结局定义对所研究结局的真实反映程度;采用多种数据来源进行分析,各种数据库中的重复结果有助于理解结论的稳健性和减少结果的偶尔性等。如果采用不同的统计分析方法得到了一致的结论,无疑将提高研究结论的可靠性。但笔者建议,敏感性分析在固定其他因素的条件下,每次只考虑变动其中一个不确定因素,以评价该不确定因素对结局的影响;如果改变多个因素,则难以评价是哪个因素导致的不一致结论。
2.未测量混杂因素的
敏感性分析方法
(1)混杂函数:2017年,Kasza等提出了混杂函数(confounding function)的敏感性分析方法,基于反事实(counterfactual)原理,通过构建混杂函数将未观测到的混杂大小度量化,通过调整混杂函数取值评价混杂因素对因果效应值在大小和方向上的影响。
令Y表示结局(1=发生,0=未发生),G表示二分类的干预变量(0=未干预,1=干预)。
定义混杂函数:
当c(0)=c(1)=1时,说明研究中不存在混杂;当c(x)>1时表示由于混杂效应的存在使得干预组发生结局的风险高于非干预组;反之,当c(x)<1时表示由于混杂效应的存在使得干预组发生结局的风险低于非干预组。因此,在敏感性分析中常借助c(0)和c(1)的大小考察未测量混杂的效应。应用时应结合专业知识设定c(0)和c(1),考察经混杂函数法校正后,所估计的干预效应是否依然存在。
(4)其他方法:基于实际研究情况,通过假设一些未知参数,例如未测量混杂所占人群比例、干预和结局与未测量混杂的相关系数等,对未测量混杂进行不同情境下的模拟,随后进行敏感性分析,若发现未测量混杂对结局的影响异常大,将推翻所观察到的干预与结局之间关联的结论,这类敏感性分析思路对未测量混杂的分布没有限制,也是众多学者热衷的一类方法。
外部数据库信息借用的敏感性分析方法是近年来的研究热点。若外部数据库包含的信息相较研究数据丰富,且包含了结局信息,可将研究数据中的未测量混杂因素视为缺失值加以填补,填补方式可考虑多重填补(multiple imputation)或Bayes填补(Bayesian imputation)等。外部信息借用的敏感性分析还可采用Monte Carlo敏感性分析(Monte Carlo sensitivity analysis,MCSA)和Bayes敏感性分析(Bayesian sensitivity analysis,BSA)。前者通过借助外部信息(例如:文献报道、Meta分析结果等),假定未测量混杂的分布,模拟产生数据从而进行未测量混杂的控制,后者同样需要借助外部信息假定未测量混杂先验分布,结合模拟产生的混杂因素样本数据,导出后验分布从而进行参数估计。这两种模拟数据的敏感性分析思路引发了一系列的探讨,如何付诸实际应用有待进一步研究。
3.案例分析
这里介绍两个利用混杂函数法和PSC法进行敏感性分析的实例。
(1)混杂函数案例分析:Kasza等基于996位接受冠心病介入治疗患者的数据信息(数据来源于Kereiakes等的研究),估计血小板聚集抑制剂阿昔单抗(abciximab)使用者6个月内的死亡风险。996名患者中有698名服用阿昔单抗,其中11名在6个月内死亡;另外298名患者未服用阿昔单抗,其中15名在6个月内死亡,未校正死亡风险RR值为0.31(95%CI:0.15~0.67)。主要分析结果基于倾向性评分及逆概率加权法(inverse probability of treatment weighting,IPTW)进行校正,校正因素选取性别、身高、是否患糖尿病,近期是否发生急性心肌梗死等7个协变量,校正后得到RR值为0.19(95%CI:0.08~0.50)。
针对上述主要分析结果,进行敏感性分析。根据临床经验可知,接受阿昔单抗的患者不可能比未接受的死亡风险高,而且接受阿昔单抗的患者通常病情比较重,在反事实的条件下,接受阿昔单抗治疗的患者,在6个月内的死亡风险更高,因而混杂函数c(0),c(1)>1是比较符合实际的假设。图 1A中以水平虚线表示c(0)=1;以垂直虚线表示c(1)=1;实线表示c(0)=c(1),c0.19(1)标注的线是指当真实效应估计值为0.19时对应c(0)和c(1)各自不同取值变化,不同的颜色区域显示不同的RR取值范围,可看到当c(0)和c(1)>1时,均RR值<0.2。图 1B中可以看出,RR值的95%CI均不包含1,当混杂函数>1时,大部分RR取值<0.19。在调整已测量和未测量混杂因素后,阿昔单抗可降低冠心病介入治疗患者的死亡风险。
图 1 混杂函数案例结果
4.总结与展望
当统计分析方法不够成熟时,针对混杂因素的不确定性所开展的敏感性分析就尤显重要。值得一提的是,虽然敏感性分析很有价值,研究者可以选择简明扼要地报告结果,也可以通过大量的敏感性分析得到更多的信息,因此需要在两者之间权衡。对于那些导致结果发生显著变化的敏感性分析,应加以关注。虽然敏感性分析的结果不能作为最终的研究结论,但是不一致的结论,足以影响研究的价值。
中华流行病学杂志
编辑部电话:010-58900730
杂志官网:http://chinaepi.icdc.cn
长按识别二维码关注我们
↓点击阅读原文查看更多内容